從今天開始記錄試用 AI 相關新技術的過程,做到哪寫到哪。
今天先從 LLM 開始。
首先先把 python 建好。
在開始前建議裝 virtualenv,這是一個用來創建 python 虛擬環境的工具
https://virtualenv.pypa.io/en/latest/
pip install virtualenv
裝完後開啟 cmd,執行指令
virtualenv C:\yourPath\venvDirName
執行成功會在
C:\yourPath 下生成資料夾 venvDirName
Windows環境下,進入 C:\yourPath\venvDirName\Scripts 裡,
執行 .\activate ,就可以進入虛擬環境。
這次選擇一個中文的模型來試試:
https://github.com/THUDM/ChatGLM-6B
直接照先 README 來架。
首先將要求的套件裝完。
這裡注意一下, 直接照 requirements 安裝會裝成 CPU 版本的 torch,可以先把它給刪掉,到官網找適合自己版本的安裝。
到 pytorch 官網選擇適合你的版本,記得注意 CUDA 版本。
https://pytorch.org/get-started/locally/
把模型載下來測試,我選擇用 git 的方式下載。
最後依照範例執行看看,裡面的路徑要換成自己的路徑。
跑起來還蠻有趣的。
最後補充一下,我自己的電腦裝的是 GeForce RTX 3060 Ti,CUDA 版本是 12.6。Python 版本用的是 3.10.6,之後有說道用自己電腦測試時,用的都是這個環境。
我也有買 Colab,之後也會用到它來測試,雖然有免費的可以用,但我覺得不太夠,所以有買他的方案,定價可以參考這裡。
https://colab.research.google.com/signup